糟糕!发文后才发现文字错误、职务错误、地图错误……还没法修改,肿么破!
表情包来自稿定设计
互联网时代,内容安全是媒体融合发展中的重要议题,即使是“老练”的媒体也常常有内容审核出纰漏的痛苦。 媒体怎么把控好各端的内容审核问题?运用“AI+人工”审核,需注意哪些问题?带着这些问题,我们来看看行业怎么破题。面对复杂的互联网内容生态,对于媒体来说最痛苦的莫过于一篇稿件经过严格的“三审三校”后,仍出现错误,轻则受罚,重则丢工作。简直是一错毁所有,潜在的内容风险防不胜防。例如,某媒体在讲述建党百年故事的视频素材中使用中国地图展现党的发展路线,然而地图左下角缺失了西藏藏南六县部分,后经发现,视频下架,相关负责人受处分。再如,部分媒体发布在新媒体端的新闻内容,留言若不经专业审核,就会出现一些不明身份的用户用一些谐音污名化、娱乐化国家政策,或用段子损害英雄烈士形象。
随着互联网信息技术的快速发展,传统的人工审核虽有严格的流程把控,但已不能及时应对瞬息万变、数量庞大的互联网内容。再加上部分审核人员经验不足,而违规内容具有覆盖场景多、数据变种多、对抗性强等特点,以及新闻报道对时效性要求高等因素,内容行业亟需通过“AI+人工”的审核方案,从底层算法到审核规则再到审核员经验,整体提升内容审核的速度、力度和准确度。党的十八大以来,习近平总书记就多次强调,要把握好网上舆论引导的时、度、效,使网络空间清朗起来;要压实互联网企业的主体责任,决不能让互联网成为传播有害信息、造谣生事的平台。随着国家对互联网内容安全的重视,相关法律法规也随之紧密出台。2017年,《中华人民共和国网络安全法》施行;2017年至2018年,《互联网论坛社区服务管理规定》《互联网跟帖评论服务管理规定》《互联网群组信息服务管理规定》等法律法规相继发布;2020年3月1日,《网络信息内容生态治理规定》正式施行……在行业的需求下和政策的引导下,内容审核行业应运而生。面对内容行业的安全挑战,“AI+人工”的审核方式,同时辅以精细化的、有针对性的审核策略以及海量涉政方向词库储备,或许是主流媒体直面内容安全挑战的选项之一。
光明日报利用网晴科技的“AI+人工”的一站式、系统化的内容生态治理全套解决方案,实现了“光明号”平台的图文、视频、小视频、评论、注册信息五大类型的平台内容风控全覆盖。广西日报也选择网晴科技,对其广西云客户端和广西新闻网红豆社区的图文、音视频、评论进行审核,分为基础审核和逻辑审核两个级别,其中部分重点内容即逻辑审核内容在审校的基础上增加逻辑性错误审核。以智能、精准的审核技术配合专业的审核团队,精细化甄别涉政危害及错误信息,确保涉政稿件万无一失。其他媒体也同样采用“AI+人工”审核的方式,如四川日报报业集团采用“四川云·云眼”进行内容审核;天津津云新媒体集团股份有限公司采用津云智媒体进行内容审核……随着互联网信息技术的发展,信息迎来爆发式增长。而信息类型庞杂、数量巨大、发布主体增多、信息真假难辨等挑战导致人工审核难度加大,再加上人工智能还处于“弱智能”阶段,因此利用“AI+人工”的形式加强对内容风险的管控成为媒体行业公认的趋势。那么“AI+人工”的审核方案是如何运行的?能否把好内容安全关?首先,要经过AI进行第一轮审核,这一轮包含四个步骤。第一步,网晴科技的智能内容审核平台会将文章的基本信息进行拆解,分为文章信息和文章内容信息。文章信息包括发布时间、作者、文章类型等基本的结构化信息,通过对应的规则将会对文章进行初步筛选,不符合规定的文章将会在这一步被拦截下来。第二步,文章会经过具有海量样本的敏感词库,过滤含有违规内容的部分。敏感词库是由长时间以来的主流媒体校审经验积累而成,第一时间响应接收、研究政策动态,并与专家研讨发掘热点,高速迭代与扩充整体词库样本。第三步,文章内容会进入审核模型,网晴科技已构建出多套系统、完善的审核模型,并持续优化更新,主要模型如领导人职务匹配模型、落马官员库模型等,从多个维度进行过滤筛查。第四步,审核平台还具备智能校对功能模块,提供包括常见错误、音/形相似错误、标点符号错误、政治用语错误、专业术语错误、搭配不当、句法错误、知识术语错误、地名错误等多方面的专业校对审核。经过上述审核流程的海量筛选,大大提高了识别的准确率以及审核效率。而仍需进行进一步评判的文章转入下一个流程,即人工审核。在人工审核流程中,智能算法会依据账号分级、文章分级、用户分级制度对内容进行分级判定,决定哪些内容需经过单审、双审或三审,再将内容分区分配给不同审核经验的审核员进行审核。人工审核团队7×24小时在线,全力确保审核的时效性。之后,还要对内容进行复检、抽检等,再根据反馈机制对违规内容进行反馈处理。处理过程中,根据各类突发状况的不同,及时定制应急策略,保障主流媒体平台的清朗内容安全生态。具体的舆情应急流程可参加下表:上述两轮审核除了文本审核,也包括图片审核,如涉政、暴恐、违禁、涉黄等图片信息的检测;还包括视频审核,如甄别视频中是否有不良画面,检测视频是否有违规风险;以及音频审核,如将音频到文本快速转换,运用音频识别+文字内容识别技术精准甄别违规内容,检测是否有涉黄、暴恐等内容。媒体业内人士认为,科学有效的内容审核机构应具有4个特质,第一是“政策密集型”特质,第二是“技术密集型”特质,第三是“管理密集型”特质,第四是“人才密集型”特质。在政策把控上,依据中央网信办、国家广电总局等部门公布的法律法规,如《中华人民共和国网络安全法》《网络信息内容生态治理规定》《互联网跟帖评论服务管理规定》《未成年人节目管理规定》等百部法律法规。在技术服务方式上,网晴科技既可以采用SaaS接入,即审核云平台提供一键式配置服务,支持系统流程按需搭建,快速初始化降低开发成本。也可以采用API接入,即独立API接口接入,提供系统内服务调用,高效快速响应,为系统定制提供有效助力。此外,还可以采用私有化平台部署,即根据业务流程量身定制服务系统,适配业务流程,提供专业化的技术支持。
在审核管理上,网晴科技针对用户的不同需求,制定了详尽规范的SOP流程及应急响应机制,规范化、专业化管理审核团队,既能高效完成日常审核工作,又能够灵活应对突发问题。促进并平衡效率、效果、效益三者关系在专业人才上,审核员团队80%以上为本科及以上学历,包括新闻、出版相关专业人才,同时配有由经验丰富的主流媒体资深编辑组成的专家团队,深度介入时政、财经、文史等方面的内容,把关完善审核策略。此外,网晴科技还拥有丰富且易用的知识库体系,含百万级的违禁命中内容,通过图文、视频、音频等方式向业务线展示,加快内容知识的流动与传播,避免知识碎片化和知识孤岛,便于团队沉淀经验、实现资源共享。网晴科技的AI预处理能力也很突出,预处理标签化能够有效提升模型训练时间及模型精确度,从而提高整体审核效率和审核准确度。对于内容行业来说,践行构建清朗网络空间的使命,非一日一方之功,这需要各级主管部门、主流媒体、以及互联网内容平台、第三方内容审核机构共同探索,积极实践,才能营造出天朗气清的网络空间。
文中图片除流程图外,由花瓣美素提供
本文经「原本」原创认证,作者传媒茶话会,点击“阅读原文”或访问yuanben.io查询【A5OPEKVA】获取授权